Die Analyse der Testgebnisse wird im allgemeinen die Notenvergabe beeinflussen. Das Ergebnis einer Aufgabe lässt sich auf zwei Arten feststellen:
Die Testautorin teilt jeder Aufgabe ein Punktemaximum zu und definiert abschliessend, welche Aufgabenteile wieviele Teilpunkte verdienen.
In TESTVERWALTUNG definiert der Autor die Punktzahl nicht direkt, sondern schätzt den Zeitaufwand ("Zeitbudget") jeder Aufgabe. Nach der Zusammenstellung eines Tests ergibt sich aus der Addition der geschätzten Zeitbudgets die maximal erreichbaren Testpunkte. Jede Aufgabe geht nach Massgabe ihres Zeitbudget in das Punktetotal ein. Die Aufteilung des Zeitbudgets auf die Mehrfach- bzw. Zuordnungsalternativen ist einfach. Die Punktezuteilung in Essayaufgaben ist schwieriger und abhängig vom Aufgabeninhalt. Aus Zuverlässigkeitsgründen wird man deshalb eine bestimmte Essayaufgabe nur von einem Korrektor beurteilen lassen.
Ermittelt man für jeden Teilnehmer das Punktetotal, so entsteht eine Häufigkeitsverteilung, die jedem Punktwert bzw. jedem Punktintervall eine Teilnehmerzahl zuordnet. Die Häufigkeitsverteilung beschreibt die Gesamtleistungen der Teilnehmer vollständig, ist aber unübersichtlich. Man wird ihre Information deshalb durch Lage- und Verteilungsparameter verdichten:
Die verbreitetsten Lageparameter sind Mittelwerte. Ein Mittelwert beschreibt einen typischen Wert der Häufigkeitsverteilung. Mögliche Mittelwerte sind der Modus (der häufigste Wert), der Median (der Wert, der die Häufigkeitsverteilung in zwei gleich grosse Teile trennt) und das ungewichtete arithmetische Mittel x (der Durchschnitt).
Die Standardabweichung (die mittlere quadratische Abweichung) ist weniger anschaulich als die mittlere Abweichung, hat aber theoretische Vorzüge. Um zu verhindern, dass sich positive und negative Abweichungen vom Mittelwert ausgleichen, werden die Abweichungen quadriert. Das Quadrieren gewichtet ausserdem grössere Abweichungen stärker als kleine. Allerdings werden nicht nur Werte, sondern auch die damit verbundenen Masseinheiten quadriert (m werden zum Beispiel zu m2). Man macht die Quadrierung der Masseinheiten deshalb durch das Ziehen der Quadratwurzel Ö rückgängig. Die Formel der Standardabweichung lautet deshalb:
Ö S(x-x)2 / n (Das Wurzelzeichen erstreckt sich über die ganze Formel).
Die Form der Häufigkeitsverteilung beeinflusst die Interpretation der Standardabweichung. Wenn man annimmt, dass die Leistungsfähigkeit von Testteilnehmern - wie viele rein biologische Merkmale - normalverteilt ist, dann ergibt sich die folgende Interpretation:
Daraus leiten einzelne Pädagogen ein Benotungsmodell ab, das innerhalb einer Teststichprobe die Punkte so verteilt, dass die Notenhäufigkeiten ungefähr normalverteilt sind. Der grösste Nachteil dieses Benotungsmodells ist seine Ungerechtigkeit aus der Sicht der Bewerteten. Es führt nämlich dazu, dass je nach der Position zweier Teilnehmer auf der Normalverteilung gleichen Punktedifferenzen ungleiche Benotungsdifferenzen zugeordnet werden. Zum Beispiel kann sich die folgende Konstellation ergeben:
Obwohl die Punkteunterschiede für die Paare [A, B] und [C, D] gleich gross
sind, ist der Notenunterschied für das erste Paar zweimal grösser als
beim zweiten Paar.